Apprentissage discriminant de modèles neuronaux pour la traduction automatique
نویسندگان
چکیده
RÉSUMÉ. Les méthodes utilisées pour entraîner des réseaux de neurones en traitement des langues reposent, pour la plupart, sur l’optimisation de critères qui sont décorrélés de l’application finale. Nous proposons un nouveau cadre d’apprentissage discriminant pour l’estimation des modèles neuronaux en traduction automatique. Ce cadre s’appuie sur la définition d’un critère d’apprentissage qui prend en compte, d’une part, la métrique utilisée pour l’évaluation automatique de la traduction et, d’autre part, le processus d’intégration de ces modèles au sein des systèmes de traduction automatique. Cette méthode est comparée aux critères d’apprentissage usuels que sont le maximum de vraisemblance et l’estimation contrastive bruitée. Les expériences menées sur les tâches de traduction des séminaires TED Talks et de textes médicaux, depuis l’anglais vers le français, montrent la pertinence d’un cadre d’apprentissage discriminant et l’importance d’une initialisation judicieuse, en particulier dans une perspective d’adaptation au domaine.
منابع مشابه
Continuous space models with neural networks in natural language processing. (Modèles neuronaux pour la modélisation statistique de la langue)
Les modèles de langage ont pour but de caractériser et d’évaluer la qualité des énoncés en langue naturelle. Leur rôle est fondamentale dans de nombreux cadres d’application comme la reconnaissance automatique de la parole, la traduction automatique, l’extraction et la recherche d’information. La modélisation actuellement état de l’art est la modélisation "historique" dite n-gramme associée à d...
متن کاملTraduction automatique de termes biomédicaux pour la recherche d'information interlingue
RÉSUMÉ. Dans cet article, nous présentons une méthode de traduction automatique de termes biomédicaux. Cette méthode s’appuie sur une technique originale d’apprentissage supervisé de règles de réécriture et sur l’utilisation de modèles de langue. Les évaluations présentées montrent que notre technique est très performante et permet de traduire à partir et à destination de n’importe quelle langu...
متن کاملSélection topologique de variables dans un contexte de discrimination
Résumé. En apprentissage automatique, la présence d’un grand nombre de variables explicatives conduit à une plus grande complexité des algorithmes et à une forte dégradation des performances des modèles de prédiction. Pour cela, une sélection d’un sous-ensemble optimal discriminant de ces variables s’avère nécessaire. Dans cet article, une approche topologique est proposée pour la sélection de ...
متن کاملAlgorithmes de Generation automatique Experience de Generation des Phrases simples du Francais
Dans ce travail on expose un algorithme i de g~n~ration automatique, dont le but est: A ) De connaltre la capacit~ g~n~rative de la syntaxe obtenue dans l'exp6rience d'apprentissage automatique d~crite ~ afro d'~valuer son degr~ d'~labortion par rapport ~t la langue en gdndral. B) De construire certaines &apes importantes de l'automatisation des processus de traduction. C) De construire tin sys...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- TAL
دوره 57 شماره
صفحات -
تاریخ انتشار 2016